Coron : Plate-forme d'extraction de connaissances dans les bases de données

نویسندگان

  • Baptiste Ducatel
  • Mehdi Kaytoue-Uberall
  • Florent Marcuola
  • Amedeo Napoli
  • Laszlo Szathmary
چکیده

Né d’un besoin logiciel pour une étude de cohorte [1], CORON est maintenant une plate-forme logicielle d’extraction de connaissances à part entière, utilisée dans divers domaines, voir par exemple [4, 5, 6]. Destinée à un usage scientifique et pédagogique, la plate-forme CORON s’articule autour de plusieurs modules pour la préparation puis la fouille de données, le filtrage et l’interprétation des unités extraites. Ainsi, à partir de données binaires (possiblement issues d’une discrétisation), CORON permet d’extraire des motifs (fréquents, fermés, etc.) puis de générer des règles d’association (non redondantes, informatives, etc.). Le système englobe ainsi des algorithmes classiques mais aussi spécifiques et propres à la plateforme [9, 11]. CORON est librement disponible au téléchargement à http://coron.loria.fr. Essentiellement programmé en Java 6.0 et rédigé en anglais, il est compatible avec Unix/Mac/Windows et s’utilise en ligne de commande.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Une brève présentation du système de fouille de données Coron

Résumé. Le système CORON est une plate-forme générique de fouille de données qui propose une très grande collection d’algorithmes standards et “maison” pour l’extraction de motifs et de règles d’association. Le système a été utilisé dans des domaines et applications très variés, et offre une panoplie de modules utilisables avec profit par un analyste lors de sa recherche de pépites dans les don...

متن کامل

Intégration des connaissances utilisateurs pour des analyses personnalisées dans les entrepôts de données évolutifs

Résumé. Dans cet article, nous proposons une approche d’évolution de schéma dans les entrepôts de données qui permet aux utilisateurs d’intégrer leurs propres connaissances du domaine afin d’enrichir les possibilités d’analyse de l’entrepôt. Nous représentons cette connaissance sous la forme de règles de type «si-alors». Ces règles sont utilisées pour créer de nouveaux axes d’analyse en généran...

متن کامل

Extraction efficace de règles graduelles

Résumé. Les règles graduelles suscitent depuis quelques années un intérêt croissant. De telles règles, de la forme “Plus (moins) A1 et ... plus (moins) An alors plus (moins) B1 et ... plus (moins) Bn” trouvent application dans de nombreux domaines tels que la bioinformatique, les contrôleurs flous, les relevés de capteurs ou encore les flots de données. Ces bases, souvent composées d’un grand n...

متن کامل

Traitement et exploration du fichier Log du Serveur Web pour l'extraction des connaissances : Web Usage Mining

Résumé : Le but dans ce travail consiste à concevoir et réaliser un Outil, en se basant sur l’ECD (Extraction de la Connaissance a partir de bases de données), en utilisant les concepts du Web Usage Mining, pour offrir aux web masters l’ensemble des connaissances, y inclut les statistiques sur leurs sites, afin de prendre les bonnes décisions. Il s’agit en faite, d’extraire de l’information à p...

متن کامل

Comparaison de critères de pureté pour l'intégration de connaissances en clustering semi-supervisé

Résumé. L’utilisation de connaissances pour améliorer les processus de fouille de données a mobilisé un important effort de recherche ces dernières années. Il est cependant souvent difficile de formaliser ce type de connaissances, comme celles-ci sont souvent dépendantes du domaine. Dans cet article, nous nous intéressons à l’intégration de connaissances sous la forme d’objets étiquetés dans le...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:
  • CoRR

دوره abs/1111.5687  شماره 

صفحات  -

تاریخ انتشار 2009